草庐IT

Java String.split 内存泄漏?

全部标签

c# - 将 XSLT 应用于内存中的 XML 并返回内存中的 XML

我正在寻找.NET框架中的静态函数,它采用XML片段和XSLT文件,在内存中应用转换,并返回转换后的XML。我想这样做:stringrawXml=invoiceTemplateDoc.MainDocumentPart.Document.InnerXml;rawXml=DoXsltTransformation(rawXml,@"c:\prepare-invoice.xslt"));//...domoremanipulationsontherawXml或者,它可以获取并返回XmlNode,而不是获取和返回字符串。有这样的功能吗? 最佳答案

xml - 由于 XML,R 不会停止获取内存/RAM

我有一个如下所示的双循环问题是R(2.15.2)使用越来越多的内存,我不明白为什么。虽然我知道这必须在内部循环中发生,因为我在那里做的rbind(),但我不明白为什么R在外部循环的新循环时不断获取内存开始并且实际上对象('xmlCatcher')被重用:#!!!BEWAREthisexamplecreatesalotoffiles(n=1000)!!!!require(XML)chunk\n\nTove\n',i,'\nJani\nReminder\n',sep=""),paste(rep('Donotforgetmethisweekend!\n',sample(1:10,1)),se

xml - 在 Spark 2.1.0 中读取大文件时出现内存不足错误

我想使用spark将一个大的(51GB)XML文件(在外部硬盘上)读入数据帧(使用spark-xmlplugin),进行简单的映射/过滤,重新排序,然后将其写回磁盘,如CSV文件。但无论我如何调整它,我总是得到一个java.lang.OutOfMemoryError:Javaheapspace。我想了解为什么增加分区数不能阻止OOM错误它不应该将任务拆分成更多的部分,以便每个单独的部分更小并且不会导致内存问题吗?(Sparkcan'tpossiblybetryingtostuffeverythinginmemoryandcrashingifitdoesn'tfit,right??)我尝

c# - 返回用内存流初始化的 SqlXml

我正在尝试从使用方法本地内存流初始化它的方法返回一个SqlXml对象。即using(StreammemoryStream=newMemoryStream()){using(XmlWriterwriter=XmlWriter.Create(memoryStream,newXmlWriterSettings{OmitXmlDeclaration=true})){serializer.Serialize(writer,myList.ToArray(),ns);returnnewSqlXml(memoryStream);}}现在调用它并尝试访问它的字段的方法因objectdisposedexc

xml - 使用 XML 包解决 R 内存泄漏

我正在尝试运行一些简单的程序来从html代码中提取表格。但是,XML包中的readHTMLTable似乎存在一些内存问题。有什么办法可以轻松解决这个问题。就像以某种方式为此命令指定一些特殊内存然后手动释放它一样。我试图将其放入一个函数中,并尝试使用gc()和不同版本的R以及该程序包,但似乎没有任何效果。我开始感到绝望。示例代码。如何在不增加内存大小的情况下运行它?library(XML)a=readLines("http://en.wikipedia.org/wiki/2014_FIFA_World_Cup")while(TRUE){b=readHTMLTable(a)#dosomet

ruby - 使用 SaxMachine 解析大文件似乎是将整个文件加载到内存中

我有一个1.6gb的xml文件,当我用SaxMachine解析它时,它似乎并没有流式传输或以block的形式吃掉文件——相反,它似乎正在将整个文件加载到内存中(或者可能有一个某处内存泄漏?)因为我的ruby​​进程向上攀升了2.5gb的ram。我不知道它在哪里停止增长,因为我的内存不足。在较小的文件(50mb)上,它似乎也在加载整个文件。我的任务遍历xml文件中的记录并将每条记录保存到数据库中。“空闲”大约需要30秒,然后数据库查询突然开始执行。我认为SAX应该允许您处理这样的大文件而无需将整个文件加载到内存中。有什么我忽略的地方吗?非常感谢更新以添加代码示例classFeedImpo

c# - 在没有内存争用的情况下将大型 xml 文件拆分为子文件

我有如下的XML............现在最好的方法是将每个作业节点写在一个单独的文件中,而不需要将整个使用xmlreader和xmlwriter或任何其他选项将文件写入内存? 最佳答案 为输入文件创建一个XmlReader。将读者定位在第一个工作元素上。使用ReadSubtreeMethod创建子树XmlReader.为输出文件创建一个XmlWriter。使用WriteNodeMethod将子树XmlReader的内容复制到XmlWriter中.将原始读者定位到下一个工作元素,继续第一个工作元素。如果没有更多的工作元素要阅读,则

xml - Haskell解析低内存的大xml文件

因此,我使用了几个HaskellXML库,包括hexpat和xml-enumerator。在阅读了RealWorldHaskell(http://book.realworldhaskell.org/read/io.html)中的IO章节后,我的印象是,如果我运行以下代码,它将在我执行它时被垃圾收集。但是,当我在一个大文件上运行它时,内存使用率在运行时不断攀升。runghcparse.hsbigfile.xml我做错了什么?我的假设错了吗?映射/过滤器是否强制它评估所有内容?importqualifiedData.ByteString.LazyasBSLimportqualifiedDa

xml - 如何在不将其加载到内存和使用 XElement 的情况下读取大型 xml 文件

我想读取一个大的xml文件(100+M)。由于它的大小,我不想使用XElement将它加载到内存中。我正在使用linq-xml查询来解析和读取它。最好的方法是什么?任何关于XPath或XmlReader与linq-xml/XElement组合的例子?请帮忙。谢谢。 最佳答案 是的,您可以将XmlReader与methodXNode.ReadFrom结合使用,请参阅文档中的示例,该示例使用C#选择性地将XmlReader找到的节点作为XElement进行处理。 关于xml-如何在不将其加载

xml - xpath中有split函数吗?

我正在尝试从节点text1|text2|text3|text4中拆分文本分为四部分“|”作为分隔符并重建4个新节点如下。text1text2text3text4这是我的代码,它显然不起作用,但应该可以解释我正在尝试做什么。 最佳答案 XPath1.0中没有split()(或等效的)函数。有一个tokenize()XPath2.0中的函数。可以使用XSLT1.0实现拆分功能--goodanswers有几个问题在xslt标签中。 关于xml-xpath中有split函数吗?,我们在Stack